class: center, middle, inverse, title-slide # Bate Papo: ## Séries Temporais & Análise Espacial em Epidemiologia ### Wagner Tassinari ### DEMAT/ICE/UFRRJ ### 28 julho 2021 --- <!-- layout: true --> <!-- <div style="position: absolute;right:50px;top:11px;color:gray;">Wagner Tassinari - DEMAT/ICE/UFRRJ</div> -->
--- # Apresentação Essa aplicação também se encontra no [Curso de Estudos Ecológicos](https://ogcruz.github.io/) ministrado para o curso de [Pós-Graduação em Epidemiologia em Saúde Pública](http://ensino.ensp.fiocruz.br/cursos/mestrado-e-doutorado/epidemiologia-em-saude-publica) em 2019, pelos pesquisadores [Oswaldo Gonçalves Cruz (PROCC/FIOCRUZ)](https://lsbastos.github.io/PROCC/membro-9530671289607786.html) e [Wagner Tassinari (DEMAT/ICE/UFRRJ)](https://institucional.ufrrj.br/ruralpesquisa/wagner-de-souza-tassinari/) --- # Delineamentos Ecológicos ## O que são Estudos Ecológicos ? - São estudos nos quais a unidade de análise (ou agregação) é uma população ou um grupo de pessoas, geralmente de uma área geográfica definida (ex: um país, um estado, uma cidade, etc.), em um determinado tempo definido. - **Definição Clássica:** é um estudo observacional com a informação obtida e analisada no nível agregado. - Geralmente são mais baratos e mais rápidos do que estudos envolvendo o indivíduo como unidade de análise. - Procuram avaliar como os contextos (sociais, ambientais, etc) podem afetar a saúde de grupos populacionais. --- # Introdução às Séries Temporais ## O que são Séries Temporais ? - Definição: Entende-se por Séries Temporais (ST) todo e qualquer conjunto de dados (absolutos ou relativos, discretos ou contínuos), ordenados cronologicamente. - Condição: Esses dados seguem uma ordenação em função do tempo (dependência temporal). --- # Alguns exemplos de séries temporais <img src="figuras/ST1.png" width="60%" style="display: block; margin: auto;" /> --- # Aplicações | Exemplos | Objetivos | |:--------------------------------------------------------------------------------------------------------------------------------------------------:|:---------------------------------------------------------------------------------------------------------:| | **Descrição:** Verificar existência de tendência, sazonalidade, ciclos. Histogramas, boxplots, são ferramentas da análise exploratória descritiva | Identificar tendência da AIDS; sazonalidade da dengue visando estabelecer melhor período de intervenção. | | **Estabelecimento de causalidade:** Estudo da relação de causa-efeito | Vacina X sarampo; Mortalidade por DIC X melhor assistência | | **Classificação:** Identificação de padrões | A série de leishmaniose tegumentar é “igual” à visceral ? | | **Monitoramento:** Detectar variações no comportamento da séries temporais conforme elas ocorram | Dosagem de Hormônios ou de sinais vitais em CTI | | **Predição (forecast):** Prever o comportamento futuro de uma série | Predição de epidemias | | **Atualização (nowcast):** Predição sobre o presente | Corrigir atraso de notificações | | | | --- # Estacionariedade - Uma série temporal é dita estacionária quando ela se desenvolve no tempo aleatoriamente ao redor de uma média constante e com uma variância constante, refletindo alguma forma de equilíbrio estável. <img src="figuras/ST2.png" width="100%" style="display: block; margin: auto;" /> --- # Tendência - É a indicadora da direção global dos dados (ou movimento geral da variável), do percurso traçado e de sua linha contínua. <img src="figuras/ST3.png" width="60%" style="display: block; margin: auto;" /> --- # Ciclo * Os ciclos são oscilações (aproximadamente regulares) em torno da tendência. Podem dever-se a fenômenos naturais, socioculturais ou econômicos, como variações climáticas (ex: excesso ou falta de chuva pode produzir ciclos agrícolas) * Variações que apesar de periódicas não são associadas automaticamente a nenhuma medida do calendário; * Aumento ou redução de frequência sem intervalos fixos. **Ex:** Ciclos Econômicos e Ciclos de epidemias. <img src="figuras/ST5.png" width="45%" style="display: block; margin: auto;" /> --- # Sazonalidade * São ciclos de curto prazo (não maiores que um ano), em torno da tendência; * Costumam se referir a eventos ligados a estação do ano, vinculados ao calendário e geralmente repetidos a cada doze meses; * Efeitos ligados à variações periódicas (semanal, mensal, anual, etc.); * Padrões que ocorrem em intervalos fixos. **Ex:** Medidas de Temperatura (aumenta no verão e diminui no inverno). <img src="figuras/ST4.png" width="50%" style="display: block; margin: auto;" /> --- # Sazonalidade * A diferença entre os ciclos, propriamente ditos, e a sazonalidade é o período de avaliação (curto e longo); * A semelhança é que ambos definem oscilações relativamente regulares em torno da tendência. * Na área de saúde é pouco comum encontrarmos ciclos, ainda que possam existir. --- # Termo Aleatório ou Ruído Branco * Conceitualmente, a componente aleatória é uma mistura de pertubações bruscas, irregulares e esporádicas nos movimentos das séries que tipificam os fenômenos. Na realidade é resultante dos efeitos de múltiplas causas que dificilmente/não conseguem ser previstos. - **Exemplos típicos de eventos aleatórios:** Secas, Enchentes, Terremotos, Ocorrência de epidemias, Crise política, etc. --- # Componentes de uma Série Temporal <img src="figuras/ST6.png" width="60%" style="display: block; margin: auto;" /> <img src="figuras/ST7.png" width="80%" style="display: block; margin: auto;" /> --- # Pressuposto da Independência * Os métodos usuais de análise estatística de dados têm como pressuposto básico a independência dos eventos (casos). Ou seja, a ocorrência de um caso de doença em uma dada pessoa seria independente da ocorrência em outra pessoa. * Pressupostos básicos para uma análise de regressão: * `\(E(e_i)=0\)` * Variância `\(\sigma^2\)` constante (homocedasticidade) * `\(e_i \sim N(0, \sigma^2)\)` * `\(e_i \neq e_j\)`, são independentes * Na análise da incidência de doenças (ou qualquer outro indicador ecológico) ao longo do tempo isso não é verdade: a incidência em um determinado dia/mês ou ano em geral é correlacionada com a ocorrência no dia/mês/ano anterior. * Esta correlação é expressa em uma função denominada função de autocorrelação - FAC (*Autocorrelation function - ACF*). --- # Função de Autocorrelação - FAC * O correlograma é uma das principais ferramentas de análise exploratória em séries temporais, pois indica como cada valor em um dado instante de tempo `\(t\)` se relaciona com os valores em `\(t+1, t+2, \dots t+j\)`. Sendo `\(H_0 : \rho_h = 0\)` <img src="figuras/ST9.png" width="45%" style="display: block; margin: auto;" /> --- # Transformações e Suavizações - As transformações e as funções de alisamento (suavização) em séries temporais são normalmente empregados para nos ajudar a ver melhor os padrões existentes - tais como as tendências e sazonalidade - e suavizar as oscilações irregulares (ruídos) para que possamos obter uma série mais limpa com um sinal mais claro. - Estas técnicas não nos fornecem um modelo, mas podem ser um bom primeiro passo na descrição para os vários componentes da série. - **Algumas técnicas de transformação:** Funções Logarítmicas, Potências, Exponenciais, ou transformação Box-Cox. - **Algumas técnicas de suavização:** Médias Móveis, Kernel, Loess/Lowess, Splines e Generalized Additive Model (GAM). <img src="index_files/figure-html/unnamed-chunk-11-1.png" width="70%" style="display: block; margin: auto;" /> --- # Tipo de Série Temporal * A série pode ser descrita como sendo a soma ou multiplicação dos componentes (tendência, sazonalidade, ciclicidade - se houver - e termo aleatório). `$$Z_t = T_t + S_t + a_t$$` `$$Z_t = T_t \times S_t \times a_t$$` <img src="figuras/ST8.png" width="80%" style="display: block; margin: auto;" /> --- # Modelos ARIMA - O método criado por Box & Jenkins envolve a identificação de um processo ARIMA (modelos autorregressivos, integrados e de médias móveis) adequado, ajustando-o aos dados e, uma vez ajustados permite também utilizar esses modelos para a descrição e/ou previsão (forecast). - Uma das características atraentes da abordagem Box-Jenkins é que os processos ARIMA são uma classe muito rica de modelos e geralmente é possível encontrar um modelo que forneça uma descrição adequada dos dados. Ajustam simultaneamente tendência, sazonalidade, ciclicidade e estrutura de dependência serial. --- ## Aplicação: Mortes mensais por doenças pulmonares no Reino Unido #### Série Bruta
--- ## Aplicação: Mortes mensais por doenças pulmonares no Reino Unido #### ST brutas por sexo
--- ## Aplicação: Mortes mensais por doenças pulmonares no Reino Unido #### Decompondo a ST <img src="index_files/figure-html/unnamed-chunk-15-1.png" width="100%" /> --- ## Aplicação: Mortes mensais por doenças pulmonares no Reino Unido #### Verificando a sazonalidade <img src="index_files/figure-html/unnamed-chunk-16-1.png" width="100%" /> --- ## Aplicação: Mortes mensais por doenças pulmonares no Reino Unido #### ACF <img src="index_files/figure-html/unnamed-chunk-17-1.png" width="100%" /> --- ## Aplicação: Mortes mensais por doenças pulmonares no Reino Unido #### Utilizando o modelo ARIMA <img src="index_files/figure-html/unnamed-chunk-18-1.png" width="100%" /> --- ## Aplicação: Mortes mensais por doenças pulmonares no Reino Unido #### Predição para 5 anos
--- # Introdução à Análise Estatística Espacial ## O que é Análise Estatística Espacial ? - São métodos estatísticos que levam em consideração a localização espacial do fenômeno estudado; - Segundo Bailey & Gatrell (1995), *"Análise estatística espacial pode ser realizada quando os dados são espacialmente localizados e se considera explicitamente a possível importância de seu arranjo espacial na análise ou interpretação dos resultados"* --- ## Origem da Estatística Espacial - Dr. John Snow (1813-1858) `\(\rightarrow\)` Considerado pai da Epidemiologia Moderna <img src="figuras/snow2_2019.png" width="60%" style="display: block; margin: auto;" /> Mapeamento dos casos de coléra ($\bullet$) e as bombas de água (X) em Londres, 1854. --- ## Objetivos da Estatística Espacial 1) Análise de padrões espaciais e espaço-temporais (ex: Análise Exploratória Espacial, Correlação Espacial) 2) Modelagem Espacial (ex: Modelos Estatísticos de Regressão Espacial) --- ## Dependência Espacial ou Autocorrelação Espacial - *"Todas as coisas se parecem, coisas mais próximas são mais parecidas que aquelas mais distantes."* (Tobler, 1979). <font color='red'>Também conhecida como `\(1^a\)` Lei da Geografia</font> --- ## Tipologia dos Dados Espaciais Os diferentes tipos de dados espaciais são tradicionalmente classificados de acordo com uma tipologia. Esta caracterização diz respeito a natureza estocástica da observação. <img src="figuras/slide4.jpg" width="85%" style="display: block; margin: auto;" /> --- ## Padrões Pontuais - O principal interesse está no conjunto de coordenadas geográficas representando as localizações exatas de eventos. - Exemplos: Localização de crimes, localização da residência dos casos de dengue, localização de espécies vegetais, etc. <img src="figuras/coordenadas.png" width="25%" style="display: block; margin: auto;" /> <img src="figuras/pontos1.jpg" width="55%" style="display: block; margin: auto;" /> --- ## Estimativas de Kernel (ou Mapas de Calor) #### Exemplo: Localização da ocorrência de casos de dengue em Belo Horizonte/MG <img src="figuras/dengueBH.png" width="45%" style="display: block; margin: auto;" /> --- ## Geoestatística - Podemos definir como sendo uma análise de um atributo espacialmente contínuo amostrado em localizações fixas. - Os dados compreendem um conjunto de localizações (em geral latitudes e longitudes), mas atribuidos a eles uma medida. - Exemplos: volume de chuva, concentração de poluentes no ar, número de ovos de Aedes postado em ovitrampas, etc. --- ## Krigagem #### Exemplo: Mapa sobre o teor de argila no solo. <img src="figuras/geoestatistica7.png" width="90%" style="display: block; margin: auto;" /> --- ## Dados de Área - Na análise de áreas o atributo estudado é em geral resultado de uma contagem ou uma medida de síntese (em geral somas ou médias) em uma determinada área bem definida, por exemplo um polígono. - Tal polígono cuja forma pode ser complexa bem como as relações de vizinhança. - O objetivo é a detecção e explicação de padrões e tendências observados entre áreas. --- ### Mapa Temático #### Exemplo: Porcentagem de municípios com rede de esgoto de acordo com a unidade da federação
--- ## Moran Global, Moran Local e Lisa Map #### Exemplo: Desigualdade no nível distrital na cobertura de saúde reprodutiva, materna, neonatal e infantil na Índia <img src="figuras/moran_local2.png" width="75%" style="display: block; margin: auto;" /> [Fonte: Panda et al., 2020](https://bmcpublichealth.biomedcentral.com/articles/10.1186/s12889-020-8151-9) --- ## Modelos de Regressão Espacial - <font color='orange'> Hipótese de independência das observações em geral é Falsa </font> `\(\rightarrow\)` Dependência Espacial - Efeitos Espaciais `\(\rightarrow\)` Se existir forte tendência ou correlação espacial, os resultados serão influenciados, apresentando associação estatística onde não existe (e vice-versa); - <font color='darkred'>**Como verificar ?** </font> `\(\rightarrow\)` Medir a autocorrelação espacial dos resíduos da regressão (Índice de Moran dos resíduos). - Autocorrelação espacial constatada ! E agora ? `\(\rightarrow\)` Utilizar Modelos de regressão que incorporam efeitos espaciais: --- ## Modelos de Regressão Espacial i) **Modelos Globais:** utilizam um único parâmetro para capturar a estrutura de correlação espacial `\(\rightarrow\)` ex: *Spatial Error Models (CAR)* `$$y_i = \beta_0 + \sum^{p}_{k} \beta_k x_{ik} + \varepsilon_i \text{ , sendo } \varepsilon_i = \lambda W + \xi$$` - Os efeitos da autocorrelação espacial são associados ao termo de erro. Sendo `\(W\)` a matriz de vizinhaça, `\(\varepsilon\)` a componente do erro com efeitos espaciais, `\(λ\)` é o coeficiente autoregressivo e `\(\xi\)` é a componente do erro com variância constante e não correlacionada. - A hipótese nula para a não existência de autocorrelação é que `\(\lambda = 0\)`, ou seja, o termo de erro não é espacialmente correlacionado. ii) **Modelos Locais:** parâmetros variam continuamente no espaço ex: *Geographically Weighted Regression (GWR)* `$$y_i = \beta_{0}(u_i, v_i) + \sum^{p}_{k} \beta_k (u_i, v_i) x_{ik} + \varepsilon_i \text{ , sendo } (u_i, v_i) \text{ as coordenadas geográficas}$$` [Fonte: ARDILLY, Pascal et al. Manuel d'analyse spatiale. 2018.](https://ec.europa.eu/eurostat/documents/3859598/9462709/INSEE-ESTAT-SPATIAL-ANA-18-EN.pdf) --- ## Ferramentas para análise estatística espacial: ### SiG QGIS <img src="figuras/QGIS.png" width="60%" style="display: block; margin: auto;" /> [QGIS: Um Sistema de Informação Geográfica livre e aberto](https://www.qgis.org/pt_BR/site/) --- ## Ferramentas para análise estatística espacial: ### GEODA <img src="figuras/GEODA.png" width="70%" style="display: block; margin: auto;" /> [GEODA: AN INTRODUCTION TO SPATIAL DATA ANALYSIS](https://spatial.uchicago.edu/geoda) --- ## Ferramentas para análise estatística espacial: ### SatScan <img src="figuras/satscan.png" width="60%" style="display: block; margin: auto;" /> [SatScan: A free software that analyzes spatial, temporal and space-time](https://www.satscan.org/) --- ## Ferramentas para análise estatística espacial: ### R <img src="figuras/logo_ubuntu.png" width="50%" style="display: block; margin: auto;" /> Fonte: [Dicas para integração e instalação do R 4.0 no Ubuntu 20.04 LTS e os pacotes espaciais](https://rtask.thinkr.fr/installation-of-r-4-0-on-ubuntu-20-04-lts-and-tips-for-spatial-packages/) --- ## Aplicação: Análise exploratória utilizando os dados de dengue em Dourados/MS - Nesta apresentação serão utilizados os dados que fizeram parte da dissertação de [Isis Rodrigues Reitman](https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=3666174) intitulada *"SAÚDE E AMBIENTE URBANO: A RELAÇÃO DE INCIDÊNCIA DE DENGUE E AS DISPARIDADES ESPACIAIS EM DOURADOS - MS"*, apresentada no [Programa de Pós-Graduação em Geografia da Universidade Federal da Grande Douradosos/MS](https://portal.ufgd.edu.br/pos-graduacao/mestrado-doutorado-geografia/index), em abril de 2016. --- ## Representação da distribuição dos casos georreferenciados
--- ## Kernel da incidência de dengue ### Kernel da taxa de incidência de dengue com a largura de banda de 500m <img src="index_files/figure-html/unnamed-chunk-44-1.png" width="150%" /> --- ## Autocorrelação da taxa de incidência de dengue Dourados/MS ### Correlograma <img src="index_files/figure-html/unnamed-chunk-45-1.png" width="100%" /> --- ## Autocorrelação da taxa de incidência de dengue Dourados/MS #### Mapeando os polígonos que tiveram os p-valores mais significativos no Moran Local
<!-- --- --> <!-- ## Autocorrelação da taxa de incidência de dengue Dourados/MS --> <!-- #### Mapeando os polígonos que tiveram os p-valores mais significativos no Moran Local --> <!-- ```{r, echo=F, out.width="70%"} --> <!-- # Moran Local (Lisa Map) da taxa de incidência Dourados/MS --> <!-- resI <- localmoran.sad(lm(setor.sf$tx ~ 1), 1:length(viz), viz, style = "W") --> <!-- ``` --> <!-- ```{r, echo=F, out.width="100%"} --> <!-- setor.sf$MoranLocal <- summary(resI)[,1] --> <!-- library(scales) --> <!-- map2 <- ggplot(setor.sf) + --> <!-- geom_sf(aes(fill = MoranLocal), color = 'black') + --> <!-- scale_fill_gradientn(colours=c("blue", "white", "red"), --> <!-- values=rescale(c(min(setor.sf$MoranLocal), 0, max(setor.sf$MoranLocal))), guide="colorbar") + --> <!-- ggtitle("Moran local") + --> <!-- theme_void() --> <!-- ggplotly(map2) --> <!-- ``` --> --- # Bibliografia sugerida - Druck, S.; Carvalho, M.S.; Câmara, G.; Monteiro, A.V.M. (eds). [Análise Espacial de Dados Geográficos. Brasília, EMBRAPA, 2004](http://www.dpi.inpe.br/gilberto/livro/analise/cap2-eventos.pdf) - Hyndman, Rob J.; ATHANASOPOULOS, George. [Forecasting: principles and practice.](https://otexts.com/fpp2/) OTexts, 2018. - FERREIRA, Pedro Guilherme Costa. Análise de Séries Temporais em R: curso introdutório. 2018. - MORETTIN, Pedro A.; TOLOI, Clélia M.C. Análise de Séries Temporais: Modelos Lineares Univariados. Bluscher - ABE - Projeto Fisher. Edição 3, 2018. - Interactive Spatial Data Analysis by Trevor C. Bailey , Anthony C. Gatrell Routledge, 1995 - Applied Spatial Data Analysis with R; Roger S. Bivand, Edzer Pebesma, Virgilio Gomez-Rubio Springer; Edição: 2nd ed. 2013 - Geocomputation with R by Robin Lovelace, Jakub Nowosad and Jannes Muenchow. [Geocomputation with R](https://geocompr.robinlovelace.net/), 2021. --- # Programa de Pós-Graduação em Epidemiologia em Saúde Pública (ENSP/FIOCRUZ) - Programa de Pós-Graduação em Epidemiologia em Saúde Pública (ENSP/FIOCRUZ) [link](http://ensino.ensp.fiocruz.br/cursos/mestrado-e-doutorado/epidemiologia-em-saude-publica)) <img src="figuras/programa_epidemiologia.png" width="70%" style="display: block; margin: auto;" /> --- # Programa de Pós-Graduação em Ciências Veterinárias (IV/UFRRJ) - Programa de Pós-Graduação em Ciências Veterinárias (IV/UFRRJ) [link](http://cursos.ufrrj.br/posgraduacao/ppgcv/) <img src="figuras/programa_veterinaria.png" width="80%" style="display: block; margin: auto;" /> --- # Programa de Pós-Graduação em Estatística Aplicada (DEMAT/ICE/UFRRJ) - Programa de Pós-Graduação em Estatística Aplicada (DEMAT/ICE/UFRRJ) [link](http://cursos.ufrrj.br/posgraduacao/ppgeap/) <img src="figuras/pitagoras_ufrrj.png" width="80%" style="display: block; margin: auto;" /> --- # Obrigado !!!!! [**Wagner Tassinari** - (*wtassinari@gmail.com*)](wtassinari@gmail.com)<br> <img src="figuras/Obrigado.png" width="90%" style="display: block; margin: auto;" />